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Abstract of DE4221278 

The parallel computer network includes several units (2) consisting of a CPU (3), a random-access 
memory (4) and a bus control unit (5) linked by an internal data bus (6). The units are interconnected 
by a data transmission rail (7). 

The bus control unit and CPU feature an additional connection for exchange of status information so 
that the CPU can have access to data from any unit (2) of the network. The RAMs are protected 
against unauthorised access by association of individual storage cells with additional control stores. 
ADVANTAGE - Data exchange between individual components of the network is performed without the 
programmer's intervention and with automatic data synchronisation. 
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l 2 

Beschreibung voll zu verteilen ohne daB fur den Programmierer eine 

_ . ( . wesentliche Belastung bezuglich der Kommunikation 

Die vorhegende Erfindung bezieht sich auf ein Paral- entsteht - schlieBlich kann von alien CPU gleicherma- 

lelrechnernetzwerk nach dem Oberbegriff des Patent- Sen und gleichberechtigt auf die verteilten Daten zuge- 

anspruchsl. 5 griffen werden. 

Ein gattungsgemaBes ParaJielrechner- oder Daten- Das erfindungsgemaBe Parallelrechnernetzwerk wird 

verarbeitungsnetzwerk ist Gegenstand des Patents ... im folgenden anhand der Zeichnung naher erlautert 

(Patentanmeldung P 41 27 192.0). Dabei sind jeweils Diesezeigtin 

mehrere CPU in GestaJt von Systemeinschuben grup- Fig. I eine Schemadarstellung eines aus einer Mehr- 
penwetsezusammengefaBtundjededieserCPU-Grup- io zahl von sogenannten Parallelrechnereinheiten aufge- 

pen ist uber einen PCU mit einem Datenbus gekoppelt bauten Parallelrechnernetzwerks; 

und so im Gesamtsystem imegriert Die dabei zugrunde Fig. 2 eine Schemadarstellung zur Erlauterung der 

gelegten CPU sind jeweils so zu verstehen und konfigu- Adressierung der Mehrzahl der Parallelrechnereinhei- 

riert, dafl der notwendigerweise zugehdrige Speicher, ten; 

also der RAM uber einen internen Datenbus mit der 15 Fig. 3 eine Schemadarstellung eines RAM zur Erlau- 

CPU gekoppelt ist. und zwar jeweils so, daB von dem terung der Zugriffssicherheit 

PCU aus betrachtet die RAM den eigentlichen Prozes- Fig. 1 zeigt ein Parallelrechnernetzwerk 1, das aus 

soren, also den CPU, nachgeordnet sind Dies hat letzt- einer Vielzahl parallel zueinander angeordneter soge- 

hch zur Folge, daB bei einem Zugriff einer CPU auf den nannter Parallelrechnereinheiten 2 besteht beziehungs- 

Speicher einer beliebigen anderen CPU, urn etwa Daten 20 weise konfiguriert ist Unter einer Parallelrechnerein- 

??Mi/c ar !f bIe ZU adressieren - dieser Zu 2 riff aber die he " «t im gegebenen Zusammenhang eine Rechenein- 

UNKS oder Schmttstellen der CPU erfolgt beziehungs- heit eines Rechners zu verstehen, der auf der Grundlage 

weise abgewickelt werden muB. Die Folge davon ist, einer Mehrdaten- und Vielfachinstruktionsmaschine 

daB diese funktionalen Verbmdungen beziehungsweise (MIMD) basiert Diese Mehrdaten- und Vielfachinstruk- 

Speicherzugnffszyklen nicht nach dem sogenannten 25 tionsmaschine beziehungsweise Recheneinheit besteht 

Shared-Memory-Pnnzip, bei dem sich mehrere CPU jeweils aus einem Prozessor 3. der sogenannten CPU 

gleichberechtigt einen gemeinsamen Speicher teilen, einem Speicher 4, dem sogenannten RAM, und einer 

moghch smd, da die CPU aktiv in den Ablauf eingreifen Bussteuereinheit 5, der sogenannten PCU, welche die 

mussen. Vielmehr 1st es hierbei Aufgabe des Program- Verbindung eines internen Datenbus 6 und einer Daten- 

mierers fur den nchtigen Ablauf, d.h. die richtige Ar- 30 ubertragungsschiene(D0-Schiene)7steuen. 

beitsweise des Mehrrechnersystems. zu sorgen; glei- Die Recheneinheit ist in der Lage Programme gege- 

chermaBen muB auch die erforderliche Datensynchroni- benenfalls auch nur Programmabschnitte abzuarbeiten 

sation vom Programmierer bewaltigt werden. und kann - und zwar entsprechend der erfindungsge- 

Die der vorhegenden Zusatzerfindung beziehungs- maBen Konfiguration - uber den internen Datenbus 6 
weise Weiterbildung des dem Patent . . . (Patentanmel- 35 sowohl auf den jeweils eigenen RAM 4. als auch - liber 
dung P 41 27 192.0) emsprechenden Datenverarbei- die PCU gesteuert - auf den RAM einer anderen paraJ- 
tungsnetzwerks zugrunde liegende Aufgabe besteht lei angeordneten Paraiielrechnereinheit2zugreifen 
dann, em Parallelrechnernetzwerk der gattungsgema- Die auf einer Paralleirechnereinheit eigenstandig lau- 
Ben Art anzugeben, bei dem der Datenaustausch zwi- fenden Programme beziehungsweise Programmab- 
scnen den einzelnen Komponenten ohne Vorgabedurch 40 schnitte werden im weiteren als TASK bezeichnet de- 
den Programmierer der Anlage erfolgt und bei dem die ren mehrere auf einer Paralleirechnereinheit 2 quasi 
Datensynchromsation weitestgehend autark und auto- gleichzeitig abgearbeitet werden konnen. Jedem TASK 
matisch erfolgt. j st e ine eindeutige Identifikationsnummer zugewiesen, 

Diese Aufgabe wird durch die im kennzeichnenden beziehungsweise zugeordnet, die selbstverstandlich nur 

Teil des Patentanspruchs 1 angegebene Verschaltung 45 einmal innerhalb des Parallelrechnernetzwerks 1 exi- 

beziehungsweise Kopplung der dem Parallelrechner- stieren darf. (Dies ist von besonderer Wichtigkeit, da in 

netzwerk zugrunde Iiegenden Funktionselemente CPU, der vorliegenden Beschreibung die Identifikationsnum- 

PCU, RAM und Datenbus geldst me r der TASK zum Schutz der taskeigenen Daten, also 

Eine besondere Ausgestaltung im Hinblick auf eine der Daten die keinesfalls von einem anderen TASK be- 

sichere Arbeitsweise der RAM sowie zur Vermeidung 50 nutzt werden durf en. verwendet wird). 

von Synchronisationsproblemen ist Gegenstand des Pa- In Verbindung mit dem vorliegenden Parallelrechner- 

tentanspruchs 2. netzwerk kommt der Frage der eindeutigen Zugriffssi- 

Abgesehen von dem bereits aufgabengemaB beding- cherheit eine besondere Bedeutung zu. Dieses im nach- 

ten Vorteil, daB sich der Programmierer nicht urn die folgenden noch zu beschreibende LOCKING gewahr- 

yerteilung der Daten beziehungsweise Variablen inner- 55 leistet, daB ein RAM 4 gegen einen illegalen oder unzu- 

nalb des Parallelrechnernetzwerks zu kummern lassigen Zugriff geschiitzt ist. 

braucht, besteht ein ganz besonderer Vorzug des erfin- FGr die Funktionsweise des Parallelrechnernetzwerks 

dungsgemaBen Parallelrechnernetzwerks in der erhdh- ist ferner eine als Taskswitcher oder Scheduler bezeich- 

ten Virensicherheit. Da namhch ein Virus grundsatzlich nete Einheit von Bedeutung, die - fur gewohnlich im 

eineandere Programmspezifikation aufweist, als die der eo Betriebssystem imegriert - die Umschaltung der akti- 

anderen Programme, kann er auch nicht auf die Daten ven TASK gewahrleistet. Dadurch wird zwar der Ein- 

beziehungsweise Variablen und den Code dieser ande- druck erweckt, daB mehrere TASK gleichzeitig verar- 

ren Programme zugreif en und Unheil anrichten. Ganz beitet werden - dieser Eindruck ist jedoch f alsch, da die 

allgemein zeichnet sich das im Vorstehenden charakte- TASK nacheinander abgearbeitet werdea Die genann- 

risierte und im Detail nachfolgend zu beschreibende ^ te Umschaltung geschieht eben durch diesen Taskswit- 

Parallelrechnernetzwerk dadurch aus, daB innerhalb cher. 

dieses Parallelrechnernetzwerks die Moglichkeit be- Da der Taskswitcher eine fur die Funktionssicherheit 

stent, Daten im gesamten Parallelrechnernetzwerk sinn- des Parallelrechnernetzwerks wichtige Rolle spielt und 
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er weiterhin auch sehr schnell sein sollte und auf einen 
sogenannten, noch zu erlauternden DENIED-Zugriff 
reagieren muB, sollte er (muQ aber nicht) hardwarema- 
Qig implementiert seia (Somit sollte aus Sicherheits- 
grunden die TASK-Identifikationsnummer hardware- 
maflig vorgegeben werden). 

Die Konfiguration und Funktionsweise des Parallel- 
rechnernetzwerks 1 wird — auf der Grundlage der 
Fig. 1 und der vorstehenden Begriffsspezirikationen — 
im Nachfolgenden naher eriautert: 

Die Verschaltung beziehungsweise Verdrahtung der 
Mehrzahi von Parallelrechnereinheiten 2 geht von den 
genannten PCU 5 aus, die direkt, d. h. unmittelbar uber 
eine gewohnliche DMA-ahnliche beziehungsweise 
-analoge Zugriffsfunktion (DMA - Direct Memory Ac- 
cess) im RAM 4 der jeweiligen uber einen gemeinsamen 
Datenbus 7 gekoppelten Parallelrechnereinheiten 2 ar- 
beiten, also die Busmasterfunktion fur den internen Da- 
tenbus 6 ubernehmen konnen. Die genannte Busmaster- 
funktion wird durch Signale BUS-REQUEST (BREQ) 
und BUS-ACKNOWLEDGE (BACK) zwischen den 
Einheiten CPU 3 und PCU 5 gesteuert, wobei das Signal 
BREQ die Busfreigabeanforderung an die CPU 3 bedeu- 
tet und das Signal BACK die Busfreigabe signalisiert 

Anders als beim Datenverarbeitungsnetzwerk des al- 
teren Patents . . . (Patentanmeldung P 41 27 192.0) kon- 
nen die einzelnen Parallelrechnereinheiten 2 des Paral- 
lelrechnernetzwerks 1 uber ihre konjugierten PCU 5 
also jeweils direkt auf die RAM 4 der parallelen Paral- 
lelrechnereinheiten 2 zugreifen — die funktionalen Ver- 
bindungen brauchen also nicht mehr unter Zuhilfenah- 
me der CPU 3 abgewickelt zu werden. 

Das Ganze setzt insoweit jedoch auch eine modifi- 
zierte Adressierung voraus, und zwar wird jeweils zu- 
satzlich zur Adresse einer Parallelrechnereinheit 2 
(HEADER eine Adresse) noch die gewunschte Spei- 
cheradresse (Segment) ubertragen, aus der Daten bezie- 
hungsweise Variable gelesen beziehungsweise in die 
Daten beziehungsweise Variable eingeschrieben wer- 
den sollen. Jeweils nach Ablauf eines Zugriffs, d. h. eines 
Speicherzyklus, erhalt die den RAM 4 beanspruchende 
CPU 3 ein BesUtigungssignal, ein Fehlersignal oder ein 
DENIED-Signal. 

Der Prozessorspeicher, d. h. der RAM 4, ist als soge- 
nannte lineare Speicherbank organisiert GemaB Fig. 2 
besteht eine Adresse 10 dabei aus einem Segment 1 1 (A 0 
. . . Ai) und dem sogenannten HEADER 12 (A;+ 1 . . . A n ). 
Der HEADER 12 enthalt die Adresse der gewiinschten 
Parallelrechnereinheit 2; das Segment 1 1 enthalt die ge- 
wunschte Adresse innerhalb des adressierten Speicher- 
raums. Ist der HEADER 12 dabei gleich der Adresse der 
aktuell zugreifenden CPU 3, so findet der Zugriff inner- 
halb des eigenen RAM 4 statt (vergleiche Pfeil X in 
Fig. 1); ist die Adresse ungleich, so wird die PCU 5 ange- 
steuert und dadurch der HEADER 12 an die DO-Schie- 
ne 7 ubergeben, gleichermafien auch das Segment 11... 
sie dienen als Adresse fur den adressierten RAM (ver- 
gleiche Pfeil Y in Fig. 1) und die Parallelrechnereinheit 

Der weitere Zugriff ist wie folgt: Die durch einen 
HEADER 12 angesprochene Parallelrechnereinheit 2 
(dies ist anders als beim Patent . (Patentanmeldung P 
41 27 192.0) nicht eine CPU 3) gibt den Speicherzugriff 
auf die ubertragene Adresse frei, sofem aufgrund eines 
LOCKING kein Widerspruch entsteht Nun kann die 
entsprechende CPU frei uber den Zielspeicherbereich 
in der Parallelrechnereinheit verfiigen, insbesondere 
den Zielspeicherbereich fur sich LOCKEN, sofern ein 
sogenannter Read-Modify-Write-Zyklus vorliegt Ist 



der Zyklus vollstandig beendet, so gibt die entsprechen- 
de CPU den Speicherblock der adressierten Parallel- 
rechnereinheit 2 wieder frei Zu bemerken ist insofern 
noch, daB die adressierte Parallelrechnereinheit auch 
5 wahrend eines Zugriffs auf ihren RAM 4 frei uber den- 
selben verfiigen kann, sofern einerseits kein Buskonflikt 
vorliegt, und andererseits sie nicht Speicherbereiche an* 
spricht, die etwa von anderen Parallelrechnereinheiten 
geLOCKtsind. 
to St6Bt eine Parallelrechnereinheit 2 auf ein Speicher- 
wort, das von einem anderen TASK als dem der zu- 
griffswilligen Parallelrechnereinheit geLOCKt ist, so 
kann diese Parallelrechnereinheit nicht auf das Spei- 
cherwort zugreifen. Die entsprechende Parallelrechne- 

15 reinheit erhalt uber die DO-Schiene 7 ein DENIED-Si- 
gnal zuruck. Der Taskswitcher dieser Parallelrechne- 
reinheit 2 schaltet nun sofort auf einen anderen lauffahi- 
gen TASK urn, so daO letztiich die CPU keine Zeit durch 
Warten auf eine Speicherf reigabe verliert 

20 Zu bemerken ist, daB die Funktion des Taskswitcher 
eines der wichtigsten Merkmale des erfindungsgema- 
Ben Parallelrechnernetzwerks ist Grundsatzlich wird 
jeder Aufruf auf eine Speicherstelle, die a) nicht jedem 
TASK frei zur Verfugung steht (vergleiche PUBLIC 

25 gemaB Fig. 3) beziehungsweise b) nicht dieselbe TASK- 
Identifikation wie die aufrufende TASK hat, mit der 
sofortigen Unterbrechung des aufrufenden TASKs quit* 
tiert Der TASK wird jedoch bei einer erneuten Aktivie- 
rung nochmals mit demselben Aufruf auf dieselbe Spei- 

30 cherstelle gestartet, d h. der TASK lauft erst an, wenn 
die aufzurufende Speicherstelle freigegeben (PUBLIC) 
ist Durch diese Technik wird nicht nur die Verwaltung 
der Daten beziehungsweise Variablen organisiert, son- 
dern es werden analog auch die TASK-Aufrufe gesteu- 

35 ert; TASK werden durch das Setzen eines Startbefehls 
in einer freien (PUBLIC) Speicherstelle aufgerufen. Der 
TASK testet die Speicherstelle — enthalt sie den Start- 
befehl, so startet er, ansonsten deaktiviert er sich selbst 
und zwar durch einen Befehl an den Taskswitcher. Dem 

40 aufgerufenen TASK wird eine Antwortspeicherstelle 
des aufrufenden TASKs - die frei zuganglich (PU- 
BLIC) ist - ubergeben. Don setzt er ein Endesignal, 
sobald der TASK erfolgreich terminiert (beendet) ist. 
Der aufrufende TASK testet auf dieses Endesignal, so- 

45 fern eine TASK-Synchronisierung erforderlich ist 

Ist das Endesignal nicht gesetzt, so deaktiviert sich 
der TASK durch einen Befehl an den Taskswitcher 
selbst und startet emeut mit dem Test des Endesignals. 
Urn letztendlich die Aktualitat der Daten beziehungs- 

so weise Variablen zu gewahrleisten, insbesondere jedoch 
urn zu verhindern, daB wahrend eines sogenannten Re- 
ad- Modify- Write-Zyklus falsche Informationen gelesen 
werden (wahrend eines Modify k6nnte eine andere CPU 
die Daten lesen, welche allerdings bereits durch den 

55 Modify auf einer anderen CPU nicht mehr aktuell sind) 
ist ein Speicher-LOCK-Mechanismus vorgesehea Hier- 
zu werden - vergleiche Fig. 3 - neben den ublichen 
RAM 4 sogenannte Kontrollspeicher t4 implementiert, 
die Auskunft uber die Zugriffsrechte geben. In diesem 

60 Kontrollspeicher 14 werden die Identifikationsnum- 
mern der TASK abgelegt, die den jeweiligen Speicher- 
elementen zugeordnet sind; daruberhinaus enthalt die- 
ser Kontrollspeicher 14 Informationen daruber ob das 
Speicherelement fur Fremdzugriffe freigegeben ist oder 

65 nicht. (Variablen die fur Fremdzugriffe freigegeben sind, 
werden innerhalb der dazugehorenden TASK als PU- 
BLIC bezeichnet — dieses Verfahren ist durch objekt- 
orientierte Programmiersprachen — vergleiche OOPS 
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- bekannt), 

Beispielsweise kann fiber eine - vergleiche a) in 
Fig. 3 - aus lauter tT bestehende "Date" angegeben 
sein, daB der als konjugierte Speicherplatz einem Zu- 
griff offen, also die Variabel PUBLIC deklariert ist Ge- 5 
maB der in b) dargestellten Daten ist angegeben, daB 
der Speicher durch das Betriebssystem geLOCKt ist. 

Das Beispiel c) zeigt, daB ein TASK mit der Identifika- 
tionsnummer "2" gerade auf den konjugierten zugreift; 
im Beispiel d) sei gezeigt, daB prinzipiell die Moglichkeit t0 
besteht, Variablen fur Gruppen (Programme) zu LOK- 
KEN, indem zum Beispiel das hochstwertige Bit angibt, 
ob eine Gruppe (Gmppenidentifikation) oder eine 
TASK-Identifikation vorliegt 

Grundsatzlich stehen im System auch erweiterte 
Speicherzugriffe zur Verfugung: 

READ LOCK: Lesen und LOCKEN des Speichers (Ein- 
schreiben der eigenen Task-IDENTIFIJCATION) 
WRITE LOCK: Schreiben und LOCKEN des Speichers 20 
(Einschreiben der eigenen Task-IDENTIFIKATION) 
READ UNLOCK: Lesen und UnLOCKEN des Spei- 
chers (Loschen der eigenen Task-IDENTIFIKATION) 
WRITE UNLOCK: Schreiben und UnLOCKEN des 
Speichers (Loschen der eigenen Task-IDENTIFIKA- 25 
TION) 

Bei jedem Zugriff wird dabei getestet, ob der Spei- 
cher nicht von einem anderen Task gesperrt ist 
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L Aus einer Vielzahl von (im folgenden CPU ge- 
nannten) Prozessoren,(im folgenden RAM genann- 
ten) Speichem und (im folgenden PCU genannten) 35 
Bussteuereinheiten zur funktionalen Verbindung 
der CPU's uber eine (im folgenden DO-Schiene 
genannte) gemeinsame Datenubertragungsschiene 
bestehendes Parallelrechnernetzwerk nach Patent 
(PatentanmeidungP41 27 192.0), dadurch gekenn- 40 
zeichnet, 

daB je eine CPU (3). ein RAM (4) und ein PCU (5) 
eine Mehrdaten- und Vielfachinstruktionsmaschine 
(MIMD)bilden,und 

daB eine Vielzahl der Mehrdaten- und Vielfachin- 45 
struktionsmaschine (Parallelrechnereinheiten 2) 
uber die DO-Schiene (7) funktional derart mitein- 
ander gekoppelt sind, daB die DO-Schiene (7) un- 
mittelbar mit den PCU's (5) und diese fiber einen 
internen Datenbus (6) einerseits mit der konjugier- 50 
ten CPU (3) und andererseits mit dem konjugierten 
RAM (4) verbunden sind, wobei PCU (5) und CPU 
(3) eine zusatzliche Verbindung zum Austausch von 
Statusinformationen aufweisen, so daB die CPU (3) 
auf die Daten beziehungsweise Variablen jeder be- 55 
liebigen Parallelrechnereinheit (2) zugreifen kann. 
2. Parallelrechnernetzwerk nach Anspruch 1, da- 
durch gekennzeichnet, daB die RAM's (4) gegen 
einen unberechtigten Zugriff dadurch geschutzt 
sind, daB den einzelnen Speicherzellen je eine zu- 60 
satzliche Kennung (Kontrollspeicher) zugeordnet 
ist. 
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